NVIDIA H100
NVIDIA Hopper 架构旗舰数据中心 GPU(2022 发布),是 2023-2024 年 AI 训练/推理事实标准芯片,全球算力租赁市场定价基准、出口管制焦点,衍生中国特供版 NVIDIA H800 / H20。
技术参数
| 维度 | 数值 |
|---|---|
| 架构 | Hopper |
| 发布 | 2022-03(GTC 公布)/ 2022-09 量产 |
| 制程 | TSMC 4N(定制 4nm) |
| 晶体管数 | 800 亿 |
| 封装 | CoWoS-S |
| FP16 / BF16 算力 | ~989 TFLOPS(稀疏 ~1,979 TFLOPS) |
| FP8 算力 | ~1,979 TFLOPS(稀疏 ~3,958 TFLOPS) |
| FP32 算力 | ~67 TFLOPS |
| 显存 | 80 GB HBM3(H100 SXM5) |
| 显存带宽 | 3.35 TB/s |
| TDP | 700W(SXM5) |
| 互联 | NVLink 4(双向 900 GB/s)+ PCIe Gen5 |
| 整机形态 | HGX H100 8 卡(DGX H100 / 各家 OEM) |
在 AI 算力链中的角色
H100 是 3-02-AI算力租赁-智算服务 当前市场最核心的定价基准。中国市场租赁价从 2024 初约 $13/GPU 小时降至 2025 中约 $5/GPU 小时(全球从 $5 → $2.4,据 3-02),腰斩驱动因素:
- 供给扩张 — CoreWeave / Nebius / Lambda Labs 及中国 利通电子 / 协创数据 / 中贝通信 等大规模圈卡部署
- 效率革命 — DeepSeek 等高效模型让相同任务 GPU 需求降低
- 新品迭代 — NVIDIA B200 / GB200 NVL72 上市后 H100 进入"主力价格带"
H100 是算力租赁商财务模型的核心变量——租赁商的折旧周期(通常 3-5 年)和定价能否覆盖 ¥30-40 万/颗的采购成本,直接决定盈利能力。
主要使用者
国际:
- 云厂商:AWS / Microsoft Azure / Google Cloud Platform / Oracle Cloud Infrastructure
- Neoclouds:CoreWeave(25 万+ NVIDIA GPU 部署)/ Nebius / Lambda Labs
- AI 实验室:OpenAI / Anthropic / Meta / xAI / Mistral
中国(H100 本身受出口管制,国内主要通过灰色渠道 + 部分早期合法采购):
与同代竞品对比
| 产品 | 厂商 | FP16 | HBM | 备注 |
|---|---|---|---|---|
| H100 SXM5 | NVIDIA | ~989 TFLOPS | 80GB HBM3 | 标杆,CUDA 生态壁垒 |
| MI300X | AMD | ~1,307 TFLOPS | 192GB HBM3 | 显存大,ROCm 生态弱 |
| TPU v5p | ~459 BF16 TFLOPS | 95GB | 内部使用,JAX 生态 | |
| 昇腾910B | 华为 | ~280 TFLOPS(推测) | 64GB HBM2e | 国产替代,CANN 生态 |
| 思元 590 | 寒武纪 | ~256 TFLOPS(推测) | 48GB HBM2e | 国产替代 |
中国出口管制衍生型号
- NVIDIA H800 — 2023 发布,NVLink 带宽缩减至 400 GB/s(H100 的 50%),算力保留 ~95%。2024-10 美国新一轮管制后实质受限
- NVIDIA H20 — 2024 发布,进一步降算力至 ~148 TFLOPS FP16(H100 的 15%)以符合管制,但仍是中国 AI 公司唯一合规可大量采购的高端 NVIDIA GPU
- A800 / A100 — 上一代 Ampere 架构对应中国特供版
价格走势与商业意义
| 时间 | 全球租赁价($/GPU 小时) | 中国租赁价($/GPU 小时) |
|---|---|---|
| 2024 初 | $5 | $13 |
| 2024 中 | $4 | $9 |
| 2025 初 | $3 | $7 |
| 2025 中 | $2.4 | $5 |
商业意义:H100 价格腰斩是 3-02 全行业的核心宏观因子——直接挤压跨界算力公司毛利、加速 74 家+ A 股算力概念股的洗牌、推动从"卖卡"向"卖服务"商业模式转变。同时 H100 价格下行也是 AI 推理普及的关键推手,将更多中小 AI 应用拉入推理算力消费市场。
关联
↑ up::2-01-核心逻辑芯片 CoWoS HBM ↓ down::3-01-云计算与智算平台 3-02-AI算力租赁-智算服务 4-02-模型工厂 4-04-模型部署与优化 ⚔ competitor::AMD MI300X Google TPU v5p 华为 昇腾910B AMD MI300X AWS Inferentia 2 AWS Trainium 2 Google TPU v6 Trillium 华为昇腾910B 寒武纪MLU590 昇腾910C ∈ belongs_to::2-01-核心逻辑芯片
关联深度报告
→ 3-02-AI算力租赁-智算服务 2-01-核心逻辑芯片